iT邦幫忙

2025 iThome 鐵人賽

DAY 1
2
生成式 AI

從 RAG 到 Agentic RAG:30 天打造本機智慧檢索系統系列 第 1

Day 1: 為什麼要還要寫RAG? 又為什麼要從 RAG 到 Agentic RAG?

  • 分享至 

  • xImage
  •  

🔍 為什麼要寫這個系列?

Hi 我是Seedfood,是一名DA轉DS轉MLE再轉AI的雜技Data人。

今年在強者我朋友們的力推下,勇敢地參加了這屆的鐵人賽,希望把過去2年在做RAG的一些心路歷程做一些回顧和分享,也訓練自己輸出的能力。

在這個號稱10個工程師有11個會RAG的年代(第11個是PM),我經常遇到所謂RAG的經驗就是embedding打OpenAI、LLM打OpenAI、甚至現在還有解析檔案也直接打OpenAI,所以連Chunk都不用管,因為Context window真的夠大。可是如果你的資料不想外洩,你需要在地端建立真的動手建一套知識系統,那該怎麼做?又有多少坑需要踩過爬出呢?

筆者現在就是掉在坑內的一員,希望這次的系列能夠釣出一些已經從坑裡爬出的大大,解救還在坑內或準備跳入坑中的朋友們。


🤖 什麼是「RAG」,又為什麼要「Agentic RAG」?

如同前述,這兩年RAG(Retrieval-Augmented Generation)幾乎成為 建構 AI 系統的標配
它的基本思路很簡單:

  1. 檢索:從知識庫中找到最相關的內容
  2. 生成:把檢索結果交給 LLM 來生成答案

而中間當然還有許多技術細節,例如你的知識要轉換成向量,幫助系統更好的找到和使用者提問最相關的內容,因此需要embedding,而為了要存向量,因此你需要向量資料庫,相關的細節在這系列的文章都會提到。

由於RAG的應用簡單易懂,因此要完成一個PoC其實是不困難的,然而,當 RAG 被真正應用在實務場景時,問題就浮現了:

  • 查不到 → 答不出來:單次檢索無法覆蓋複雜問題
  • 相關 ≠ 正確:檢索回來的內容可能冗餘或誤導,導致幻覺
  • 無法分工:遇到需要計算、邏輯推理、多步驟思考時,RAG 無能為力

這也是為什麼我們需要走向 Agentic RAG

所謂 Agentic RAG,就是在傳統 RAG 架構上,加入 Agent 思維與工具使用能力
它不再是單純的「檢索 → 回答」,而是可以:

  • 分解問題 → 拆成子問題,逐步查找與回答
  • 使用工具 → 不只依靠檢索,還能呼叫計算、路由、甚至外部 API
  • 多步推理 → 根據中間結果,決定下一步行動,直到完成任務

有了上面的能力,Agentic RAG 才比較能夠在真實應用場景中落地,實際上Agent就是一個趨勢,而RAG會是Agent最得力的工具之一。


🗂️ 這個系列會怎麼進行?

為了讓整個旅程更有結構,我會將 30 天拆成 4 個週次,並且採取「知識導讀 + 實作體驗」的方式。

  • 知識導讀(5~6 天):每天針對該週核心技術主題撰寫,整理概念、架構或是比較(偏向技術筆記)。
  • 實作驗證(1–2 天):動手跑一個最小可行版本,把學到的知識轉化成能運行的程式,同時做一些測試與驗證。

進度安排如下:

📌 Week 1(09/15–09/21):Baseline 打底

  • 目標:建立一個 最小可行的 RAG 系統
  • 重點:RAG 架構、chunking 策略、embedding 模型比較、向量資料庫比較
  • 實作:預計使用 OpenAI API + Chroma + PDF parsing,完成第一個能跑的 pipeline

📌 Week 2(09/22–09/28):Retrieval 強化

  • 目標:解決檢索不足與準確率問題
  • 重點:Hybrid search、Reranker、本地 LLM 部署
  • 實作:預計使用** Qdrant + 本地模型(預計使用Llama 8B)**,並測試複雜問題

📌 Week 3(09/29–10/05):Agent 化

  • 目標:讓系統能 思考與行動
  • 重點:Agent 類型、工具化、ReAct、Self-Ask、MRKL、多步推理
  • 實作:在地端建立一個具備「檢索 + 工具使用」的 Agent,預計使用MRKL框架,搭配Qdrant以及本地模型gpt-oss-20b

📌 Week 4(10/06–10/15):監控與優化

  • 目標:讓系統能被 監控、評估、部署
  • 重點:Prometheus/Grafana、Langfuse、評估框架、幻覺處理、Streamlit UI、Caching、PQ/壓縮
  • 實作:用 Docker Compose 打包完整系統

🎯 最終成果

在第 30 天結束時,這個系列將交付:

  • 一個 從 API 串接到本地 LLM 部署的完整 Agentic RAG 系統
  • 一套 監控與評估框架,包含延遲、準確度與幻覺率指標
    如果可以,也希望能提供:
  • 一份 踩雷清單,幫助後續延伸開發

時間允許的話:

  • 向量資料庫管理 Pipeline:向量資料庫的定期刷新與維護知識庫
  • 多模態 RAG:支援文字、圖片、文件混合檢索的初步研究
  • GenBI: RAG與結構型資料的合作

📢 準備開賽

這是一場從 「簡單 RAG」→「Agentic RAG」→「可監控與部署的完整系統」 的旅程。
如果你曾經因為 RAG 成效不如預期而感到挫折,或是PoC完後看到老闆很開心但心理糾結要不要做,那麼希望這個系列能和你一起看到 如何一步步填坑讓PoC落地,建構一個能在實務場景中真正發揮作用的RAG應用系統。


下一篇
Day 2: 為什麼要還要寫RAG? Fine-Tuning不香嗎?
系列文
從 RAG 到 Agentic RAG:30 天打造本機智慧檢索系統6
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言